home *** CD-ROM | disk | FTP | other *** search
/ Skunkware 5 / Skunkware 5.iso / src / X11 / wais / ir / stoplist.c < prev    next >
C/C++ Source or Header  |  1995-05-09  |  5KB  |  436 lines

  1. /* WIDE AREA INFORMATION SERVER SOFTWARE:
  2.    No guarantees or restrictions.  See the readme file for the full standard
  3.    disclaimer.
  4. */
  5.  
  6. /* this is a set of utilities for maintaining a stoplist
  7.  * kind of a kludge.
  8.  *
  9.  * -brewster
  10.  */
  11.  
  12. #ifndef lint
  13. static char *RCSid = "$Header: /tmp_mnt/net/quake/proj/wais/wais-8-b5/ir/RCS/stoplist.c,v 1.2 92/02/12 13:50:01 jonathan Exp $";
  14. #endif
  15.  
  16. /* Change log:
  17.  * $Log:    stoplist.c,v $
  18.  * Revision 1.2  92/02/12  13:50:01  jonathan
  19.  * Added "$Log" so RCS will put the log message in the header
  20.  * 
  21.  * 
  22. */
  23.  
  24. #include "stoplist.h"
  25. #include "cutil.h"
  26.  
  27. long stoplist_pointer = 0;
  28. char *stoplist[] = {
  29.   "a",
  30.   "about",
  31.   "above",
  32.   "according",
  33.   "across",
  34.   "actually",
  35.   "adj", 
  36.   "after",
  37.   "afterwards",
  38.   "again",
  39.   "against",
  40.   "all",
  41.   "almost",
  42.   "alone",
  43.   "along",
  44.   "already",
  45.   "also",
  46.   "although",
  47.   "always",
  48.   "among",
  49.   "amongst",
  50.   "an",
  51.   "and",
  52.   "another",
  53.   "any",
  54.   "anyhow",
  55.   "anyone",
  56.   "anything",
  57.   "anywhere",
  58.   "are",
  59.   "aren't",
  60.   "around",
  61.   "as",
  62.   "at",
  63.   "b",
  64.   "be",
  65.   "became",
  66.   "because",
  67.   "become",
  68.   "becomes",
  69.   "becoming",
  70.   "been",
  71.   "before",
  72.   "beforehand",
  73.   "begin",
  74.   "beginning",
  75.   "behind",
  76.   "being",
  77.   "below",
  78.   "beside",
  79.   "besides",
  80.   "between",
  81.   "beyond",
  82.   "billion",
  83.   "both",
  84.   "but",
  85.   "by",
  86.   "c",
  87.   "can",
  88.   "can't",
  89.   "cannot",
  90.   "caption",
  91.   "co",
  92.   "co.",
  93.   "could",
  94.   "couldn't",
  95.   "d",
  96.   "did",
  97.   "didn't",
  98.   "do",
  99.   "does",
  100.   "doesn't",
  101.   "don't",
  102.   "down",
  103.   "during",
  104.   "e",
  105.   "each",
  106.   "eg",
  107.   "eight",
  108.   "eighty",
  109.   "either",
  110.   "else",
  111.   "elsewhere",
  112.   "end",
  113.   "ending",
  114.   "enough",
  115.   "etc",
  116.   "even",
  117.   "ever",
  118.   "every",
  119.   "everyone",
  120.   "everything",
  121.   "everywhere",
  122.   "except",
  123.   "f",
  124.   "few",
  125.   "fifty",
  126.   "first",
  127.   "five",
  128.   "for",
  129.   "former",
  130.   "formerly",
  131.   "forty",
  132.   "found",    "",
  133.   "four",
  134.   "from",
  135.   "further",
  136.   "g",
  137.   "h",
  138.   "had",
  139.   "has",
  140.   "hasn't",
  141.   "have",
  142.   "haven't",
  143.   "he",
  144.   "he'd",
  145.   "he'll",
  146.   "he's",
  147.   "hence",
  148.   "her",
  149.   "here",
  150.   "here's",
  151.   "hereafter",
  152.   "hereby",
  153.   "herein",
  154.   "hereupon",
  155.   "hers",
  156.   "herself",
  157.   "him",
  158.   "himself",
  159.   "his",
  160.   "how",
  161.   "however",
  162.   "hundred",
  163.   "i",
  164.   "i'd",
  165.   "i'll",
  166.   "i'm",
  167.   "i've",
  168.   "ie",
  169.   "if",
  170.   "in",
  171.   "inc.",
  172.   "indeed",
  173.   "instead",
  174.   "into",
  175.   "is",
  176.   "isn't",
  177.   "it",
  178.   "it's",
  179.   "its",
  180.   "itself",
  181.   "j",
  182.   "k",
  183.   "l",
  184.   "last",
  185.   "later",
  186.   "latter",
  187.   "latterly",
  188.   "least",
  189.   "less",
  190.   "let",
  191.   "let's",
  192.   "like",
  193.   "likely",
  194.   "ltd",
  195.   "m",
  196.   "made",
  197.   "make",
  198.   "makes",
  199.   "many",
  200.   "maybe",
  201.   "me",
  202.   "meantime",
  203.   "meanwhile",
  204.   "might",
  205.   "million",
  206.   "miss",
  207.   "more",
  208.   "moreover",
  209.   "most",
  210.   "mostly",
  211.   "mr",
  212.   "mrs",
  213.   "much",
  214.   "must",
  215.   "my",
  216.   "myself",
  217.   "n",
  218.   "namely",
  219.   "neither",
  220.   "never",
  221.   "nevertheless",
  222.   "next",
  223.   "nine",
  224.   "ninety",
  225.   "no",
  226.   "nobody",
  227.   "none",
  228.   "nonetheless",
  229.   "noone",
  230.   "nor",
  231.   "not",
  232.   "nothing",
  233.   "now",
  234.   "nowhere",
  235.   "o",
  236.   "of",
  237.   "off",
  238.   "often",
  239.   "on",
  240.   "once",
  241.   "one",
  242.   "one's",
  243.   "only",
  244.   "onto",
  245.   "or",
  246.   "other",
  247.   "others",
  248.   "otherwise",
  249.   "our",
  250.   "ours",
  251.   "ourselves",
  252.   "out",
  253.   "over",
  254.   "overall",
  255.   "own",
  256.   "p",
  257.   "per",
  258.   "perhaps",
  259.   "q",
  260.   "r",
  261.   "rather",
  262.   "recent",
  263.   "recently",
  264.   "s",
  265.   "same",
  266.   "seem",
  267.   "seemed",
  268.   "seeming",
  269.   "seems",
  270.   "seven",
  271.   "seventy",
  272.   "several",
  273.   "she",
  274.   "she'd",
  275.   "she'll",
  276.   "she's",
  277.   "should",
  278.   "shouldn't",
  279.   "since",
  280.   "six",
  281.   "sixty",
  282.   "so",
  283.   "some",
  284.   "somehow",
  285.   "someone",
  286.   "something",
  287.   "sometime",
  288.   "sometimes",
  289.   "somewhere",
  290.   "still",
  291.   "stop",
  292.   "such",
  293.   "t",
  294.   "taking",
  295.   "ten",
  296.   "than",
  297.   "that",
  298.   "that'll",
  299.   "that's",
  300.   "that've",
  301.   "the",
  302.   "their",
  303.   "them",
  304.   "themselves",
  305.   "then",
  306.   "thence",
  307.   "there",
  308.   "there'd",
  309.   "there'll",
  310.   "there're",
  311.   "there's",
  312.   "there've",
  313.   "thereafter",
  314.   "thereby",
  315.   "therefore",
  316.   "therein",
  317.   "thereupon",
  318.   "these",
  319.   "they",
  320.   "they'd",
  321.   "they'll",
  322.   "they're",
  323.   "they've",
  324.   "thirty",
  325.   "this",
  326.   "those",
  327.   "though",
  328.   "thousand",
  329.   "three",
  330.   "through",
  331.   "throughout",
  332.   "thru",
  333.   "thus",
  334.   "to",
  335.   "together",
  336.   "too",
  337.   "toward",
  338.   "towards",
  339.   "trillion",
  340.   "twenty",
  341.   "two",
  342.   "u",
  343.   "under",
  344.   "unless",
  345.   "unlike",
  346.   "unlikely",
  347.   "until",
  348.   "up",
  349.   "upon",
  350.   "us",
  351.   "used",
  352.   "using",
  353.   "v",
  354.   "very",
  355.   "via",
  356.   "w",
  357.   "was",
  358.   "wasn't",
  359.   "we",
  360.   "we'd",
  361.   "we'll",
  362.   "we're",
  363.   "we've",
  364.   "well",
  365.   "were",
  366.   "weren't",
  367.   "what",
  368.   "what'll",
  369.   "what's",
  370.   "what've",
  371.   "whatever",
  372.   "when",
  373.   "whence",
  374.   "whenever",
  375.   "where",
  376.   "where's",
  377.   "whereafter",
  378.   "whereas",
  379.   "whereby",
  380.   "wherein",
  381.   "whereupon",
  382.   "wherever",
  383.   "whether",
  384.   "which",
  385.   "while",
  386.   "whither",
  387.   "who",
  388.   "who'd",
  389.   "who'll",
  390.   "who's",
  391.   "whoever",
  392.   "whole",
  393.   "whom",
  394.   "whomever",
  395.   "whose",
  396.   "why",
  397.   "will",
  398.   "with",
  399.   "within",
  400.   "without",
  401.   "won't",
  402.   "would",
  403.   "wouldn't",
  404.   "x",
  405.   "y",
  406.   "yes",
  407.   "yet",
  408.   "you",
  409.   "you'd",
  410.   "you'll",
  411.   "you're",
  412.   "you've",
  413.   "your",
  414.   "yours",
  415.   "yourself",
  416.   "yourselves",
  417.   "z", NULL};
  418.  
  419. void init_stop_list()
  420. {
  421.   stoplist_pointer = 0;
  422. }
  423.  
  424.  
  425. char *next_stop_word()
  426. {
  427.   /* returns NULL if all out */
  428.   if(stoplist[stoplist_pointer] == NULL)
  429.     return(NULL);
  430.   else
  431.     return(stoplist[stoplist_pointer++]);
  432. }
  433.  
  434.   
  435.  
  436.